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Предлагаются два подхода к вычислению весовых коэффициентов характеристических признаков, используемых в тестовых си- 
стемах поддержки принятия решения, а именно: подход на основе формализма мультимножеств и метода анализа иерархий и 
подход на основе упрощенного метода анализа иерархий, частично решающего проблему определения весовых коэффициен- 
тов признаков для случая, когда размерность признакового пространства достаточно велика. Обсуждаются методы, реализую- 
щие данные подходы. 


Одной из наиболее важных проблем при созда- 
нии интеллектуальных систем выявления законо- 
мерностей и поддержки принятия решений являет- 
ся проблема анализа признакового пространства 
на предмет выделения наиболее значимых призна- 
ков и оценивания величины их значимости [1, 2]. 
Несмотря на то, что этой проблеме посвящено 
большое количество публикаций, например, [2-4], 
до настоящего времени отсутствует корректное 
сравнение методов ее решения. 

При решении многокритериальных задач выбора 
понятие относительной важности (весомости, зна- 
чимости) критериев является основным [1-4]. Сле- 
дует отметить, что более детально представлены ре- 
зультаты по многокритериальным функциям пред- 
почтения, использующих базовые шкалы оценок 
альтернатив по критериям [5]. Функция предпочте- 
ния, как правило, представляет собой отображение 
множества альтернатив на числовую ось, и лучшей 
альтернативе приписывается большее число. 


В интеллектуальных системах, основанных на 
методах тестового распознавания образов [2, 5, 7], 
для принятия решения используются «хорошие» 
тесты, т. е. тесты, содержащие меньшее количество 
признаков и с большим весом, где под весом теста 
понимается сумма весовых коэффициентов приз- 
наков [2]. 

Работа посвящена вычислению весовых коэф- 
фициентов характеристических признаков (ВКП), 
используемых в системах поддержки принятия ре- 
шения [1,2], основанных на тестовых методах рас- 
познавания образов. 

Основные определения и понятия 

Нижеприведенные методы вычисления весо- 
вых коэффициентов характеристических призна- 
ков основаны на матричной модели представления 
данных и знаний, включающей матрицу описаний 
(2 объектов в пространстве характеристических 
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признаков и матрицу различений Я объектов в про- 
странстве классификационных признаков [2]. 

Элемент д ч матрицы 0 задает значение /го 
признака для /-го объекта. Строка д, матрицы 0 со- 
поставляется объекту 5,(/е{1, /}), где / - число 

обучающих объектов. В случае, если у какого-либо 
объекта в матрице 0 значение признака отмечено 
символом «-», то считается, что значение соответ- 
ствующего характеристического признака безраз- 
лично (признак может принимать как нулевые, так 
и единичные значения, а в случае /значных приз- 
наков - любые целочисленные значения призна- 
ков из заданного интервала значений признака). 

Строки матрицы различений К сопоставляются 
одноименным строкам матрицы 0, столбцы - 
классификационным признакам, определяющим 
различные механизмы разбиения объектов на 
классы эквивалентности (механизмы классифика- 
ции). Элемент г 9 матрицы К задает принадлежность 
/-го объекта одному из выделенных классов по /му 
механизму классификации. Для указания факта 
принадлежности объекта классу используется но- 
мер этого класса при соответствующем механизме 
классификации. Множество всех неповторяющих- 
ся строк матрицы К сопоставлено множеству выде- 
ленных образов. Элементами образа являются 
объекты, представленные строками матрицы 0, со- 
поставленными одинаковым строкам матрицы К. 
Если имеется единственный механизм классифи- 
кации, матрица различений вырождается в стол- 
бец, что соответствует традиционному представле- 
нию знаний в задачах распознавания образов [2]. 

Задача распознавания состоит в определении по 
матрицам 0 и К образа, которому принадлежит задан- 
ный совокупностью признаков исследуемый объект, 
как правило, не входящий в обучающую выборку. 

Назовем признаки зависимыми, если имеется 
хотя бы одна пара объектов из разных образов, раз- 
личаемая этими признаками. 

Совокупность признаков, различающих все па- 
ры объектов из разных образов (классов) при каж- 
дом механизме классификации, назовем диагно- 
стическим тестом (далее слово «диагностический» 
будем опускать). 

Тест назовем безызбыточным (тупиковым [1]), 
если исключение любого признака из теста нару- 
шает его свойство быть тестом. 

При ^е{0,1,-} вводятся следующие определе- 
ния [2]. 

1. Два объекта считаются различимыми, если хотя 
бы один характеристический признак в описании 
одного из них принимают значение 1 (0), а в опи- 
сании другого - инверсное, т. е. значение 0(1). 

2. Под весовым коэффициентом признака пони- 
мается числовая оценка его различающей спо- 
собности. 

Постановка задачи. Пусть по матрицам 0 и К 
построены все (часть) безызбыточные тесты, пред- 
ставленные матрицей тестов Т, строки которой со- 


поставлены тестам, а столбцы - характеристиче- 
ским признакам, и определено число различающих 
пар «объект-объект» по каждому характеристиче- 
скому признаку. 

Требуется определить весовые коэффициенты 
характеристических признаков, входящих в объе- 
динение всех (части) безызбыточных тестов [2]. 
При этом не исключается возможность достаточно 
большой размерности признакового пространства 
и наличия взаимозависимости признаков. 

Методы оценивания весовых 

коэффициентов признаков 

При вычислении весовых коэффициентов ха- 
рактеристических признаков в тестовом распозна- 
вании [2], как правило, требуется выполнение 
условия независимости признаков (критериев) по 
предпочтению, либо не учитывается реально воз- 
можная их взаимозависимость (в смысле влияния 
оценки различающей способности одного из них 
на оценку различающей способности другого). 

Остановимся кратко на методах оценивания ве- 
совых коэффициентов признаков в интеллектуаль- 
ных системах поддержки принятия решений, ис- 
пользуемых для вычисления весов тестов и имею- 
щих отношение к поставленной задаче. 

1. В методе, основанном на различающей способ- 
ности признака [2] , предлагается следующая форму- 
ла для вычисления весового коэффициента м> т т-то 
признака: 

К-\ К N ^ Ы, 


т К-\ К ’ ѵ ' 

I I а Р ] 

і=\ і=і + 1 

где К - число выделенных образов; А, - число 
строк в описании /-го образа; / е{г,1 }, 5“=0, если 
=0 или д т =д іт =\ (д іт и д іт - элементы матрицы 
0 из разных образов); 8~=рр^ ; (/ - число зна- 

чений «-» в /-ой строке матрицы 0, р, - коэффици- 
ент повторения /-ой строки), если д іт =0 и д іт =\ или 
Яі „= 1 и /„=0; 8;=рр^‘-\ если д іт =«-» и (или) 
д м =«—»; о. - число объектов в /ом образе 
вычисляемое по формуле: 

к = 1 

Метод вычисления весовых коэффициентов 
признаков на основе оценки его различающей спо- 
собности признаков весьма прозрачен, прост и эф- 
фективен при репрезентативной выборке, но при 
условии независимости оцениваемых признаков. 

2. Основанный на формализме мультимножеств 
[3] и методе анализа иерархий (МАИ) [4] метод 
определения В КП учитывает вклад признаков в 
распознающую способность теста с учетом их взаи- 
мозависимости и базируется на представлении со- 
вокупности всех различимых пар объектов из раз- 
ных образов для каждого признака ъ ь і=1,2,...,М, в 
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виде мультимножества, применении метода анали- 
за иерархий Саати, использующего парные сравне- 
ния признаков на основе специальным образом 
выбранной меры относительной важности призна- 
ков, учитывающей их взаимозависимость [5]. 

Соответствующий признаку і т т - й столбец ма- 
трицы 0 порождает совокупность Р т различимых 
этим признаком пар объектов из разных образов 
{(/'-у)|/е С г1 /е Р„гФ1,д т щ т }, где Р,=Ш+ 

/V, - число строк в /-ом образе,/- номер 1-й стро- 
ки в матрице 0для /-го образа, 1е{г,{}, т. е. признак 
І т порождает мультимножество Р т . 


Метод состоит из трех этапов, на каждом из ко- 
торых формируется матрица парных сравнений 
(МПС) признаков ад,,...,^,,...,^ (/ и е{ 1, ..., Щ, §- 
количество признаков в тесте) на основе опреде- 
ленной меры относительной важности признака / 
над признаком у, в качестве которой поэтапно вы- 
бираются величины: 



8{Р-Р ] 


80 Р-Р, 

8(1 Р-РІУ 


( 2 ) 


где |Р,| - мощность (общее количество элементов) 
/-го мультимножества, соответствующего признаку 
іі, / Р ',/ - размерность (количество элементов, встре- 
чающихся один раз) /-го мультимножества, Р—Р, - 
разность мультимножеств, соответствующих приз- 
накам 7,і и і р где 5(х)=х, если хфО, и 5(х)= 1 , иначе. 

На 5-м (5е{ 1,2,3}) этапе по данному методу вы- 
числяется # - компонентный вектор значений ве- 
совых коэффициентов признаков - 
Иф=м^і,м^ 2 ,...,ѵѵ м , совпадающий со значением нор- 
мализованного главного собственного вектора со- 
ответствующей матрицы (по Саати [4] - локальные 
приоритеты). Вектор Ж=(Ж,-Ж 2 -Ж,) 1/3 представляет 
собой обобщенные значения весовых коэффици- 
ентов признаков (глобальные приоритеты [4]), вхо- 
дящих в тест. 

Вышеуказанные меры позволяют учесть не 
только общие свойства сравниваемых признаков 
(степень сходства или различия), но, что особенно 
важно, и уникальные их свойства (степень приори- 
тетности одного признака над другими). 

Следующий результат устанавливает связь меж- 
ду двумя вышеупомянутыми методами. 

Теорема 1. Нормализованный главный соб- 
ственный вектор матрицы парных сравнений приз- 
наков В / |=(ѵТ| /| ,ѵѴ|, г ,...,н’ 1 , л ) с мерой относительной 

|/}| 

важности признака і над признаком у, равной 

равен вектору Ж 0 =(>ѵ“,іѵ",...,іѵ, 0 ), где >ѵ" - нормали- 
зованный коэффициент ( т , /,„е{1, ..., М\), получен- 
ный по формуле (1). 

Известно, что при использовании метода ана- 
лиза иерархий указанный способ определения ве- 
сового вектора существенно опирается на свойство 
совместности матрицы парных сравнений и не яв- 
ляется обоснованным в случае его нарушения. 


Решение задачи 

Кратко изложим подход, основанный на форма- 
лизме мультимножеств и упрощенном МАИ, кото- 
рый частично решает проблему нахождения ВКП 
для случая достаточно большой размерности приз- 
накового пространства. Как известно, данная задача 
до сих пор является нетривиальной не только в слу- 
чае задания предпочтений экспертами вручную, но и 
в случае, когда относительная важность ВКП вычи- 
сляется по предложенным в [2, 5} формулам. Напри- 
мер, в случае 50-ти признаков, используемых в зада- 
чах диагностики, количество парных сравнений со- 
ставит 1200, что является не только трудоемким про- 
цессом, но и проблематичным для хранения такого 
объема данных в памяти ЭВМ. 

Данный подход существенно опирается на идею 
В.Д. Ногина [6} о «базисных» элементах (располо- 
женных выше (либо ниже) главной диагонали), на 
основе которых затем легко и без ошибок вычисли- 
тельного характера находится искомый весовой 
вектор. Выбор конкретного «базисного» набора со- 
ответствует той или иной схеме сравнения объек- 
тов, которую можно выбирать с целью получения 
наиболее надежных результатов. Методы, реали- 
зующие данный подход, во-первых, основаны на 
совместной матрице А и, таким образом, избавле- 
ны от «модельной» ошибки; во-вторых, обеспечи- 
вают количество требуемых сравнений существен- 
но меньшее традиционно требуемых. 

Для изложения метода перечислим требования 
к матрице относительных весов 

II II ѴѴ- 

А= а,, , а и =— , 

II У ПМхМ у ц , . 

где щ, іѵ, - компоненты весового вектора 
ІѴ=(щ,щ,...,щ) г [4]: 1) а^>0; //=1, 2) а=а/; 
і^=\,...,М\ 3) а а.-а. ІА,к=\ 4) число М явля- 
ется максимальным собственным значением ма- 
трицы А, и для некоторого единственного (норми- 
рованного) вектор-столбца (Ѵ=(щ, с по- 
ложительными компонентами выполняется равен- 
ство: А \Ѵ=М Ж 

Подход к решению данной проблемы, связан- 
ный с упрощенным вариантом МАИ, автором 
адаптирован следующим образом. 

Сначала выбираются М-1 базисных элементов, 
на основе которых определяются все остальные эл- 
ементы МПС. Способ выбора базисных элементов 
является задачей творческой и зависит от модели 
задачи (и решения эксперта), в частности, от вы- 
бранной меры сравнения относительной важности 
признаков. Применительно к рассматриваемой за- 
даче рассмотрим два следующих метода в рамках 
указанного подхода. 

Первый метод связан с выбором некоторого 
«идеального» признака-образца, в качестве кото- 
рого может служить либо признак с наибольшим 
значением ВКП, рассчитанным по формуле (1), 
либо объединение у/} всех мультимножеств, по- 
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рожденных соответствующими признаками 
(і=\,...,М). Далее формируем первую строку на ос- 
нове соответствующей меры относительной важ- 
ности (2) признака-образца над остальными приз- 
наками, элементы которой являются базисными. 
Остальные элементы МПС находятся из условия, 
обеспечивающего выполнение свойства совмест- 
ности матрицы парных сравнений: 

а \ і 

а ц =а п -а и =— , і = 2,М, ]=\,М. (3) 

а и 

Тогда компоненты весового ненормализован- 
ного вектора ХѴ у =(\ѵ/,м> 2 ,...,\ѵ//) т (верхний индекс 
«У» означает «упрощенный»), следуя теореме 1 [6], 
вычисляются по формуле: 

И = (4) 

а и 

Таким образом, компоненты весового вектора 
составляют последний столбец МПС А, элементы 
которой получены по формуле (3). 

Преимущество данного способа с точки зрения 
трудоемкости вычислений очевидно: вместо вычи- 
сления М(М—Х)/2 величин потребуется вычислить 
только 2М—3 величин, т. е. в М/4 раза меньше при 
достаточно большом объеме М. К тому же, в случае 
экспертного задания оценок, формулы (3), (4) 
обеспечивают не только экономию времени, но и 
согласованность МПС, т. е. избавляют от «модель- 
ной» ошибки. 

Второй метод предполагает выбор базисных эл- 
ементов а п ,а гь ...,а м _ іи , который реализует схему 
последовательного сравнения (некоторый «идеаль- 
ный образец» сравнивается с 1-м, затем 1-й срав- 
нивается со вторым и т. д.). 

Сформулируем основные результаты. 

Теорема 2. Пусть МПС И=||ад|| построена по 
следующим правилам: 

1) элементы а п ,а 23 ,...,а м _ ім являются базисными и 

определяются по формуле: 

р і- р і\) ( _ 8(1Р 1 -Р ] 1) " 

*Ѵ р Г р іІП (5 ) 

і = \,М -\, і = 2уМ\ 



2) остальные элементы определяются по формуле: 
а у = а, ѵ _ 1 ' а ] _ 1] , і = \,М - 2, і < / - 1 . (6) 

Тогда МПС Л=|14„,„ удовлетворяет всем требо- 
ваниям относительных весов 1-4, и компоненты 
ненормированного собственного вектора ІУ опре- 
деляются по формуле: 


,і= \,М— 1, ѵг м = 1. 


Теорема 3. Если матрица парных сравнений 
/НЫ|„ „с элементами, вычисленными по формуле 
(2), удовлетворяет всем требованиям относитель- 
ных весов 1-4, то ее собственный вектор совпадает 
с собственным вектором МПС, элементы которой 
вычислены по формулам (5), (6). 


Отметим, что второй способ предполагает вы- 
числение компонентов собственного вектора по 
базисным элементам, определяемым по точным 
формулам (2), и количество требуемых сравнений 
определится числом М-1, что в М/2 раз меньше 
традиционно требуемых сравнений. 


Иллюстративный пример. Пусть заданы матрицы 
0, К, Т, представленные на рисунке. Вычислим для 
отдельного теста значения весовых коэффициен- 
тов признаков по вышеизложенным методам, на- 
пример, для теста Тр={г ь ,^, 1 и ). 


Для простоты изложения матрица различений К 
представлена одним столбцом. 


Заметим, что число строк матрицы 0 увеличит- 
ся на 3, так как каждая из строк 3, 6, 7 представля- 
ет собой интервал булева пространства (содержит 
по одному символу «-») и представляется двумя 
строками. 


Сравним численные значения весовых коэф- 
фициентов признаков, полученных по методу на 
основе МАИ [5] и методу, использующему упро- 
щенный МАИ. Ввиду громоздкости МПС при 
большой ее размерности, а также имея в виду, что 
интерес, главным образом, представляет: а) по- 
грешность в точности получаемых оценок по дан- 
ным методам, т. е. | ХУ’-ѴУ], где XV м и ѴУ - нормали- 
зованные собственные векторы, соответствующим 
МПС; б) факт совместности МПС или значение 
индекса согласованности в указанных методах, 
рассмотрим получение значений весовых коэффи- 
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циентов признаков для вышеупомянутого теста 
построенного по матрицам 0, К, Т, 

рисунок. 

В матрице парных сравнений признаков на ос- 
нове меры относительной важности — -\- 

3(\р,~Ц\) 

расположим признаки по неубыванию мощностей 
соответствующих разностей мультимножеств 
(табл. 1), учитывая, что |_Р 5 -Р 9 |=13, |Р 9 — Р 5 |= 15, 
|Р 5 -Л,|=14, |р„-р 5 |=14, |р 9 -р„|=10, I ІѴРН. 


Таблица 1. МПС признаков на основе меры относительной 
важности II и МАИ 



Ря 

Рб 

А 

ИЛ 

Р 9 

1 

15/13 

5/4 

0,375 

Рб 

13/15 

1 

14/14 

0,317 

А 

4/5 

14/14 

1 

0,308 


МПС признаков на основе выбранной меры от- 
носительной важности и упрощенного МАИ, т. е. 
формул (5), (6), имеет вид (табл. 2): 


Таблица 2. МПС признаков на основе меры относительной 
важности II и упрощенного МАИ 



Ря 

Рб 

Р„ 

ИЛ 

|ИЛ-ИЛ| 

Ря 

1 

15/13 

5/4 

0,375 

0,000 

Рб 

13/15 

1 

(5ТЗ)/(4-15) 

0,325 

0,008 

Р„ 

4/5 

(4Т5)/(5ТЗ) 

1 

0,300 

0,008 


Обратим также внимание на погрешность, свя- 
занную с индексом совместности МПС по методу, 
основанному на мультимножествах и МАИ, имея в 
виду, что уровень отношения согласованности ра- 
вен 0,001 (для применимости МАИ желательным 
считается значение, меньшее 0,1 [4]): 


МЛ 


0 

0,031 

0 , 033 " 

а- — 

7 ѵѵ,- 

= 

0,023 

0 

0,027 



0,022 

0,026 

0 


Таким образом, «модельная ошибка» в методе, 
основанном на мультимножествах и точных фор- 
мулах (1), оказалась больше (максимальное откло- 
нение равно 0,033), чем максимальное отклонение 
равное 0,008, позволяющих в 2 раза со- 
кратить количество сравнений и упростить проце- 
дуру вычисления собственного вектора. 

Для сравнительной оценки двух изложенных 
подходов к определению весов тестов может быть 
использован функционал качества, аналогичный 
введенному в [7], минимум которого укажет на бо- 
лее эффективный подход при принятии итогового 
решения для конкретной задачи распознавания. 


Заключение 

Весьма важным моментом в процессе выявле- 
ния закономерностей данных и принятия решений 
в интеллектуальных системах является не только 
определение совокупности наиболее информатив- 
ных (значимых) признаков (критериев), но и выяв- 
ление отношений между ними. Приведенные мето- 
ды позволяют количественно учесть вклад отдель- 
ного признака в различающую способность теста в 
условиях независимости (формула (1)) и возмож- 
ной взаимозависимости (формулы (2), (5), (6)) вхо- 
дящих в тест признаков в условиях большой раз- 
мерности признакового пространства. 

Иллюстративный пример дает основание пола- 
гать, что учет специфики задачи с целью выбора со- 
ответствующего (более подходящего) метода при- 
водит к построению более точных оценок значений 
весовых коэффициентов признаков, используемых 
в интеллектуальных системах поддержки принятия 
решений различного назначения. 

Изложенный подход к определению ВКП, ос- 
нованный на мультимножествах и упрощенном 
МАИ, может быть применен для решения реаль- 
ных задач большой размерности с динамическими 
предпочтениями и приоритетами. Так, задача прог- 
нозирования экспертных предпочтений связана с 
получением оценок приоритетности альтернатив в 
форме зависимостей от времени. 

Для динамических задач матрица парных срав- 
нений содержит функции времени в качестве эл- 
ементов, поэтому максимальное собственное чи- 
сло А шах , а также собственный вектор Жтакже будут 
зависеть от времени, т. е. А{!) 1Н(/)=Я тах (/) Щг). Из- 
вестно, что для этого уравнения можно получить 
аналитическое решение [4], если порядок матрицы 
А(1) не превышает четырех. В противном случае 
данное уравнение решается численными методами 
для различных моментов времени 1 с последующей 
аппроксимацией с целью получения зависимости 
компонент вектора приоритетов Щі) от времени. 
Предложенный метод вычисления ВКП на основе 
упрощенного МАИ позволяет снять ограничение 
на порядок матрицы А(1) и следить за ее согласо- 
ванностью во времени. 

Теорема 1 содержит обоснование подхода, позво- 
ляющего существенно сократить количество вычи- 
слений при подсчете весовых коэффициентов приз- 
наков с мерами относительной важности признака і 
над признаком у, см. (2), учитывающими возможную 
взаимозависимость входя щ их в тест признаков. 

Теоремы 2 и 3 содержат условие, гарантирую- 
щее применение предложенного подхода в задачах 
тестового распознавания без существенной по- 
грешности. 

Работа выполнена при финансовой поддержке РФФИ 
(проект № 04-01-00144), РГНФ (проект № 06-06- 12603в). 
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